# BeautifulSoup
# 导入模块
import requests
from bs4 import BeautifulSoup

# 准备文档字符串
html = requests.get('http://www.santostang.com/').content.decode()

# 创建Beautiful Soup对象
soup = BeautifulSoup(html, 'lxml')  # 指明解析器为lxml

# 查找 title 标签
title = soup.find(name='title')  # 返回标签为title的第一个元素
print(title)

# 查找 a 标签
a = soup.find('a')
print(a)

# 查找所有的 a 标签
a_s = soup.find_all('a')
print(a_s)

# 根据属性进行查找
# a = soup.find(id='name')
a = soup.find(attrs={'id': 'name'})
print(a)
print(type(a))  # <class 'bs4.element.Tag'>

# 根据文本内容进行查找
text = soup.find(text='首页')
print(text)

print('标签名:', a.name)  # 获取标签的名称
print('标签所有属性:', a.attrs)  # 获取标签的所有属性
print('获取标签文本内容:', a.text)  # 获取内容
